home *** CD-ROM | disk | FTP | other *** search
/ Mac-Source 1994 July / Mac-Source_July_1994.iso / C and C++ / Libraries / stringsearch / bmsource / lc.fwdg.md2.c-A < prev    next >
Encoding:
Text File  |  1991-05-06  |  3.5 KB  |  170 lines  |  [TEXT/MPS ]

  1. /*
  2.     search routine generated by gen.
  3.     skip=lc, match=fwd, guard=guard, shift=md2
  4. */
  5. #include    "freq.h"
  6. #include    "sd.h"
  7. /*
  8.  * The authors of this software are Andrew Hume and Daniel Sunday.
  9.  * 
  10.  * Copyright (c) 1991 by AT&T and Daniel Sunday.
  11.  * 
  12.  * Permission to use, copy, modify, and distribute this software for any
  13.  * purpose without fee is hereby granted, provided that this entire notice
  14.  * is included in all copies of any software which is or includes a copy
  15.  * or modification of this software and in all copies of the supporting
  16.  * documentation for such software.
  17.  * 
  18.  * THIS SOFTWARE IS BEING PROVIDED "AS IS", WITHOUT ANY EXPRESS OR IMPLIED
  19.  * WARRANTY.  IN PARTICULAR, NEITHER THE AUTHORS NOR AT&T MAKE ANY
  20.  * REPRESENTATION OR WARRANTY OF ANY KIND CONCERNING THE MERCHANTABILITY
  21.  * OF THIS SOFTWARE OR ITS FITNESS FOR ANY PARTICULAR PURPOSE.
  22.  */
  23.  
  24. #ifndef    CHARTYPE
  25. #define    CHARTYPE    unsigned char
  26. #endif
  27. #define    MAXPAT    256
  28.  
  29. #include    "stats.h"
  30.  
  31. #ifndef    TABTYPE
  32. #define    TABTYPE    long
  33. #endif
  34. typedef TABTYPE Tab;
  35.  
  36. static struct
  37. {
  38.     int patlen;
  39.     CHARTYPE pat[MAXPAT];
  40.     Tab delta[256];
  41.     int loopoffset;    /* patlen-1 - skip loop char */
  42.     int rarec, rareoff;
  43.     int md2;
  44. } pat;
  45.  
  46. prep(base, m)
  47.     CHARTYPE *base;
  48.     register m;
  49. {
  50.     CHARTYPE *skipc;
  51.     register CHARTYPE *pe, *pb;
  52.     register int j, r;
  53.     register Tab *d;
  54.     double tmax, fr;
  55.     extern double tcmp;
  56.     extern option;
  57.     int rrr, rr;
  58.     register CHARTYPE *pmd2;
  59.  
  60.     pat.patlen = m;
  61.     if(m > MAXPAT)
  62.         abort();
  63.     memcpy(pat.pat, base, m);
  64.     skipc = 0;
  65.     stats.len = m;
  66.     if(sd[m] == 0){
  67.         for(j = m; sd[j] == 0; j--)
  68.             sd[j] = 12;
  69.     }
  70.     d = pat.delta;
  71.     tmax = 2+tcmp;
  72.     for(pb = pat.pat, pe = pb+pat.patlen-1; pb <= pe; pb++){
  73.         fr = (1+tcmp*freq[*pb])/sd[pb-pat.pat];
  74. #ifdef    STATS
  75. /*printf("i=%d: f=%.4f freq[%c]=%.5f sd=%.1f\n", (pb-pat.pat), fr, *pb, freq[*pb], sd[pb-pat.pat]);/**/
  76. #endif
  77.         if(tmax > fr){
  78.             tmax = fr;
  79.             r = pb-pat.pat;
  80.         }
  81.     }
  82.     pat.loopoffset = m-1-r;
  83. if(option >= 0) pat.loopoffset=option;
  84.     skipc = &pat.pat[m-1-pat.loopoffset];
  85.     for(j = 0; j < 256; j++)
  86.         d[j] = m-pat.loopoffset;
  87.     for(pb = pat.pat, pe = pb+m-1-pat.loopoffset; pb <= pe; pb++){
  88.         d[*pb] = pe-pb;
  89.     }
  90.     rrr = 0;
  91.     for(rr = 1; rr < m; rr++){
  92.         if(freq[pat.pat[rr]] < freq[pat.pat[rrr]])
  93.             rrr = rr;
  94.     }
  95.     pat.rarec = pat.pat[rrr];
  96.     pat.rareoff = rrr;
  97.     for(pmd2 = skipc-1; pmd2 >= pat.pat; pmd2--)
  98.         if (*pmd2 == *skipc) break;
  99.     pat.md2 = skipc - pmd2;    /* *pmd2 is first leftward reoccurance of *pe */
  100. #ifdef    STATS
  101.     stats.extra += pat.md2;
  102. #endif
  103. }
  104.  
  105. exec(base, n)
  106.     CHARTYPE *base;
  107. {
  108.     int nmatch = 0;
  109.     register CHARTYPE *e, *s;
  110.     register Tab *d0 = pat.delta;
  111.     register k, s_offset;
  112.     register ro, rc;
  113.     register CHARTYPE *p, *q;
  114.     register CHARTYPE *ep;
  115.     register md2 = pat.md2;
  116.  
  117.     k = pat.patlen-1-pat.loopoffset;    /* k is char we loop on */
  118.     s = base+k;
  119.     e = base+n;
  120.     memset(e, pat.pat[k], pat.patlen);
  121.     s_offset = -k;
  122.     ro = pat.rareoff+s_offset;
  123.     rc = pat.rarec;
  124.     ep = pat.pat + pat.patlen;
  125.     while(s < e){
  126. #ifdef    STATS
  127.         k = d0[*s];
  128.         stats.jump++;
  129.         while(k){
  130.             stats.jump++; stats.step[k]++;
  131.             k = d0[*(s += k)];
  132.             stats.jump++; stats.step[k]++;
  133.             k = d0[*(s += k)];
  134.             stats.jump++; stats.step[k]++;
  135.             k = d0[*(s += k)];
  136.         }
  137.         if(s >= e)
  138.             return(nmatch);
  139. #else
  140.         k = d0[*s];
  141.         while(k){
  142.             k = d0[*(s += k)];
  143.             k = d0[*(s += k)];
  144.             k = d0[*(s += k)];
  145.         }
  146.         if(s >= e)
  147.             return(nmatch);
  148. #endif
  149. #ifdef    STATS
  150.         stats.slow++;
  151. #endif
  152.         if(s[ro] != rc)
  153.             goto mismatch;
  154.         for(p = pat.pat, q = s+s_offset; p < ep; ){
  155. #ifdef    STATS
  156.             stats.cmp++;
  157. #endif
  158.             if(*q++ != *p++)
  159.                 goto mismatch;
  160.         }
  161.         nmatch++;
  162.     mismatch:
  163. #ifdef    STATS
  164.         stats.step[md2]++; stats.jump++;
  165. #endif
  166.         s += md2;
  167.     }
  168.     return(nmatch);
  169. }
  170.